跳到主要内容

Markov 链

阐述

离散时间

离散时间 Markov 链是一种随机过程,并且它的概率分布满足

P(Xi=ziX0,,Xi1)=P(Xi=ziXi1=zi1)\mathbb P(X_i=z_i|X_0,\cdots,X_{i-1})=\mathbb P(X_i=z_i|X_{i-1}=z_{i-1})

如果进一步地,这个概率不依赖于 ii,则它是时间均一的。如无特殊说明,默认它是时间均一的。

转移矩阵表示

对 Markov 链定义 Pi(x,y)=P(Xi=yX0=x)P^i(x,y)=\mathbb P(X_i=y|X_0=x),可以将它看作一个由 x,yx,y 标记的矩阵。这个矩阵的特点是它的每一行之和都为 1。特别地,P1=PP^1=P 称为它的转移矩阵。这个矩阵就可以看作是 Markov 链本身。

带权有向图的表示

Markov 链可以用一个带权有向图 G=(V,E)G=(V,E) 表示,其中 V=XV=\mathcal X,并且如果 P(x,y)>0P(x,y)>0,则 (x,y)E(x,y)\in E,并且它的权重就是此概率。此时,该 Markov 链可以看作是一个带权随机游走。

连续时间

第一种定义

NtN_t 是一个 Poisson 过程,XiX_i 是一个 Markov 链,则 XNtX_{N_t} 是一个 Markov 过程。这个也可以看作:在每一个状态等待一个指数分布的时间,然后跳跃。

定义转移矩阵 Pt(x,y)=P(Xt=tX0=x)P^t(x,y)=\mathbb P(X_t=t|X_0=x),则有

Pt(x,y)=n(λt)nn!etλKn(x,y)=exp(λt(IK))P^t(x, y)=\sum_n \frac{(\lambda t)^n}{n !} e^{-t \lambda} K^n(x, y)=\exp(-\lambda t(I-K))

第二种定义

生成子:矩阵满足 Q(x,y)0Q(x,y)\ge0 如果 xyx\ne y,并且它的每行之和为 0。

QQ 为生成子以及 X\mathcal X 为状态空间的随机过程 XtX_t 定义为:给定 Xs=xX_s=x,等待时间 δtexp(Q(x,x))\delta t\sim\exp(-Q(x,x)) 分布的时间,然后按照跃迁矩阵 K=D1(QD)K=-D^{-1}(Q-D) 选择另一个状态;而如果 Q(x,x)=0Q(x,x)=0,则永远停在 xx

这个定义也可以解读为:给定 Xs=xX_s=x,对于各个状态 yy 我们都有一个独立的 Tyexp(Q(x,y))T_y\sim\exp(Q(x,y)) 状态,然后移动到使这些 TyT_y 最小化的状态 zz

Markov 性

连续时间的 Markov 性表现为,以 XtX_t 为条件,未来的 Xt+sX_{t+s} 与从 XtX_t 开始的一个 XsX_s 链的分布是相同的。

实例

赌徒的 Markov 链

X=N\mathcal X=\mathbb NXiX_i 是在时刻 ii 拥有的钱,在每一步有 1/2 的几率增加一个或者减少一个。

图上的随机游走

令无向图 G=(V,E)G=(V,E)X=V\mathcal X=V,每一步 Xi+1X_{i+1}XiX_i 的各个邻居中选择。

性质

连通性

给定 Markov 链 PP 以及 x,yXx,y\in\mathcal X,称 x,yx,y 连通(xyx\sim y),如果 x=yx=y,或者存在 i,j>0i,j>0 使得 Pi(x,y)>0P^i(x,y)>0Pj(y,x)>0P^j(y,x)>0

连通是一种等价关系。这意味着我们可以将 X\mathcal X 划分为若干个不相交的等价类,即

X=X1Xk\mathcal{X}=\mathcal{X}_1 \cup \cdots \cup \mathcal{X}_k

连续时间的连通性

对于连续时间 Markov 链,Pt(x,x)>0P^t(x,x)>0,而 Pt(x,y)>0P^t(x,y)>0 当且仅当 i,Ki(x,y)>0\exists i, K^i(x,y)>0

不可约性

这些等价类也称为连通类。在图上,它们相当于图的强连通分量。如果一个 Markov 链只有一个强连通分量,则称它是不可约的。

闭性

一个连通类 AXA\subseteq\mathcal X 是闭的,如果对于所有的 xA,y∉Ax\in A,y\not\in A,都有 P(x,y)=0P(x,y)=0,也即无法离开 AA

对于两个不同的类 A,BA,B,我们称 ABA\to B,如果存在 xA,yBx\in A,y\in B 使得 P(x,y)>0P(x,y)>0。如果 ABA\to B,那么就不能有 BAB\to A

所有有限状态的 Markov 链都有一个闭类。

周期性

定义 Markov 链 PP 的周期为

per(x)=gcd{iPi(x,x)>0}\operatorname{per}(x)=\operatorname{gcd}\left\{i \mid P^i(x, x)>0\right\}

同一个连通类中的元素周期总是相同。所以,对于不可约 Markov 链,可以定义它的周期即是任何一个元素的周期。如果周期是 1,那么称它是非周期性的。

对于一个周期 kk 的 Markov 链,可以将 X\mathcal X 划分为多个不相交的集 C1,,CkC_1,\cdots,C_k,其中 P(x,y)>0P(x,y)>0 当且仅当 xCix\in C_iyCi+1y\in C_{i+1}

返回时

给定 X0=xX_0=x,定义首次返回时

τx+=min{i>0Xi=x}\tau_x^+=\min\{i>0|X_i=x\}

τx+\tau_x^+ 也是一个随机变量,它的分布由 xx 和 Markov 链 PP 决定。

对于不可约 Markov 链以及有限状态空间,总有 E(τx+)<\mathbb E(\tau_x^+)<\infty

相关内容

参考文献